توسعه مدل های دسته بندی و استخراج قواعد بر مبنای نوع داده

پایان نامه
چکیده

دسته بندی یکی از اهداف مهم داده کاوی و بازیابی دانش بوده که به تخصیص یک نمونه به دو یا چند دسته یا گروه از پیش تعیین شده گفته می شود. دسته بندی در زمینه های مختلف مطالعاتی از جمله مباحث مالی، بیولوژی، پزشکی و غیره کاربرد دارد. افزایش عملکرد و قابلیت مدل های دسته بندی همیشه مورد توجه بوده است. انتخاب مشخصه یک روال پیش پردازش در داده کاوی و شناخت الگو است. این رساله با استفاده از نظریه مجموعه سخت و تابع درجه وابستگی، الگوریتمی کارا برای انتخاب مشخصه معرفی نموده و با گسترش یک درخت از زیرمجموعه های مشخصه های اصلی و جستجوی حداقلی با هرس کردن برخی از شاخه ها براساس خاصیت یکنوایی و همچنین شروع جستجو از یک جواب حریصانه، الگوریتمی کارا و دقیق برای مجموعه داده های رسته ای ارائه می نماید. همچنین مدل های دسته بندی با عملکرد مناسب توسعه داده می شود که توانایی مواجه با انواع مشخصه ها شامل عددی، رسته ای و مخلوط را داشته و بتواند بدون تغییر شکل آنها، رفتار متمایزی با هر نوع داده داشته باشد. در واقع، معیارهای فاصله یا مشابهت مدل استنتاج مبتنی بر نمونه ساخته می شود. این معیارهای فاصله، ضمن لحاظ کردن وزن هر مشخصه، از فاصله اقلیدسی برای مشخصه های عددی و از وقوع همزمان مقادیر مختلف برای مشخصه های رسته ای استفاده می کند. محاسبه مقادیر مختلف مشخصه های رسته ای در دو وضعیت با توجه و بدون توجه به دسته محاسبه می شود. علاوه بر این، الگوریتم ژنتیکی پیشنهاد می شود که همانند مدل های استنتاج مبتنی بر نمونه نیاز به عملیات پیش پردازش نداشته و ضمن داشتن عملکرد قابل قبول می تواند قواعد دسته بندی را استخراج نماید. نتایج بدست آمده،حاصل اجرای الگوریتم ها و مدل های دسته بندی پیشنهادی بر روی مجموعه داده های شناخته شده و مقایسه آنها با نتایج ابزارهای تحقیقات پیشین می باشد. مسئله عیب چسبندگی بر روی کلاف های نورد سرد شرکت فولاد مبارکه به عنوان یک مسئله دسته بندی در نظر گرفته شد و پارامترهایی که در ایجاد این عیب، موثر بودند شناسایی شده و بر اساس وجود یا عدم وجود اطلاعات انتخاب گردیدند. پس از پالایش مجموعه داده، عملکرد مدل های دسته بندی پیشنهادی رساله و برخی از ابزارهای شناخته شده روی این مجموعه داده، مورد آزمون قرار گرفته و مشخصه های با اهمیت در دسته بندی ورق ها شناسایی و قواعد دسته بندی با بالاترین دقت جهت تنظیم پارامترهای مختلف فرآیندی به منظور کاهش و حتی حذف عیب استخراج گردیده اند.

منابع مشابه

ارائه روشی مناسب برای دسته بندی نامه های الکترونیکی تبلیغاتی بر مبنای پروفایل کاربران

In general, Spam is related to satisfy or not satisfy the client and isn’t related to the content of the client’s email. According to this definition, problems arise in the field of marketing and advertising for example, it is possible that some of the advertising emails become spam for some users, and not spam for others. To deal with this problem, many researchers design an anti-s...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

مدل بندی داده های فازی با رگرسیون اسپلاین تطبیقی چندگانه

در این مقاله به مدل بندی داده های ورودی دقیق-خروجی فازی پرداخته می شود و رویکرد رگرسیون مارس فازی با پارامترهای دقیق و جملات خطای فازی معرفی می گردد. روش پیشنهادی شامل دو مرحله است: در مرحله اول با استفاده از رگرسیون اسپلاین تطبیقی چندگانه (مارس) مراکز متغیر وابسته برآورد می شوند، و در مرحله دوم کمترین مقادیر خطاهای فازی بر اساس یک مساله بهینه سازی غیر خطی به دست می آیند. در انتها کاربرد مدل ...

متن کامل

بخش بندی مشتریان بر اساس ارزش دوره عمر آنها با استفاده از داده کاوی بر مبنای مدل آر.اف.ام. (RFM)

     امروزه تعامل شرکت­ها با مشتریان در قالب مدیریت ارتباط با مشتری به طور قابل­ توجهی تغییر یافته است. شناسایی ویژگی­های مشتریان مختلف و تخصیص بهینه منابع به آنها با توجه به ارزشی که برای شرکت­ها دارند، به یکی از دغدغه­های اصلی در حوزه مدیریت ارتباط با مشتری تبدیل شده است. هدف این مقاله ارائه مدل مناسبی جهت بخش­بندی مشتریان بر اساس ارزش دوره عمر آنها می­باشد. در فرایند پیشنهادی این تحقیق که در...

متن کامل

بهبود روش های شهودی استخراج قوانین فازی برای دسته بندی و پیشنهاد روشی بر مبنای خوشه بندی

اخیراً سیستم دسته بند فازی مبتنی بر قانون به طور گسترده ای در مسائل دسته بندی مورد استفاده قرار گرفته است. به طور اساسی? طراحی این سیستم ها شامل پیدا کردن یک مجموعه فشرده از قوانین دسته بندی فازی اگر-آن گاه است که بتوانند رفتار ورودی- خروجی سیستم را مدل کنند. روش های زیادی برای تولید قوانین دسته بندی فازی ارائه شده است که عبارتند از: روش های شهودی? روش های بر مبنای خوشه بندی? روش های بر مبنای ال...

15 صفحه اول

معرفی، دسته بندی و شیوه شناسی کتیبه های صحیفی جوهری

صحیفی جوهری یکی از چیره‌دست‌ترین خوش‌نویسان ثلث دوره صفوی است که دستی هم در شعر داشته؛ با این حال، چنان که باید شرح احوال و آثارش در تاریخ خوش‌نویسی ایران مورد توجه قرار نگرفته است. صحیفی از بزرگ‌زادگان طایفة ذوالقدر شیراز بوده که در اصفهان رشد کرده و همانجا نیز وفات کرد. این پژوهش در نظر دارد ضمن معرفی آثار موجود و قابل دسترس این خوش‌نویس، به دسته‌بندی آن‌ها از چند منظر مختلف بپردازد و شیوة نگ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده مهندسی صنایع

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023